AI资讯新闻榜单内容搜索-DeepSeek

LLM近期重大架构进化一览：从Gemma 4到DeepSeek V4

过去一段时间，很多人对大模型都有一个明显感受：token 总是不够用。

来自主题: AI技术研报

7327 点击 2026-05-19 15:32

这样问DeepSeek，能「偷」到数据？

近日，有网友在 X 上发文称，在使用 DeepSeek 的过程中，如果在输入框内输入以下这一段内容，便可「窃取」到 DeepSeek 的训练数据：仔细看了之后发现，具体是这样的：只要你在输入框输入这一段提示词，DeepSeek 就会「吐出」一轮完整的对话记录，不过这并不是你的历史搜索记录，更像是一份随机的对话记录。

来自主题: AI技术研报

9376 点击 2026-05-11 17:29

Redis之父发布ds4.c，为Mac本地跑DeepSeek V4打造专属极速本地推理工具

DeepSeek V4，已经开始逼着海外开发者为它修专属高速公路了。发布才两周，开源圈里，第一批V4原生基础设施已经冒了出来。它只干一件事：把DeepSeek V4 Flash，在Mac上跑到极致。这条“专属高速公路”，叫ds4.c。而把修出来的人，分量有点吓人——

来自主题: AI资讯

9535 点击 2026-05-08 15:33

DeepSeek首轮融资曝光，估值450亿美元

据金融时报的最新消息，多家机构目前正寻求领投 DeepSeek 的首轮融资。如果谈判顺利，DeepSeek 在本轮的估值将达到约 450 亿美元。短短几周内，DeepSeek 的估值就从刚开始被爆料的 200 亿美元一路狂飙翻倍。

来自主题: AI资讯

9339 点击 2026-05-06 16:46

DeepSeek版Claude Code登顶热榜：8700星，鲸鱼哥火了

感谢鲸鱼兄弟开源。

来自主题: AI技术研报

6633 点击 2026-05-06 14:28

DeepSeek做大→Mega MoE，Tri Dao团队加快→SonicMoE

近日，由普林斯顿大学 Tri Dao（FlashAttention 的一作）和加州大学伯克利分校 Ion Stoica 领导的一个联合研究团队也做出了一个超快的索尼克：SonicMoE。据介绍，SonicMoE 能在英伟达 Blackwell GPU 上以峰值吞吐量运行！并且运算性能超过了 DeepSeek 之前开源并引发巨大轰动的 DeepGEMM。

来自主题: AI技术研报

8004 点击 2026-05-04 10:17

DeepSeek V4最大的遗憾

DeepSeekV4的技术报告里有mHC，有CSA，有HCA，有Muon，有FP4……唯独没有Engram。Engram在今年1月由DeepSeek和北大联合开源，主要研究大模型的记忆与效率问题。

来自主题: AI技术研报

7514 点击 2026-05-03 22:45

千元横测GPT、DeepSeek、Xiaomi、MiniMax的最强模型，我找到了跟Agent们的绝配

上周太集中发的后果就是光在用GPT -5.5了，小米的Mimo-V2.5-Pro，DeepSeek V4 Pro还没有放在Agent的场景上测。所以我跟钱包一拍即合，复制了4个一模一样的Hermes Agent，记忆一样，skill一样，系统设置一样，能调用的工具也一样。

来自主题: AI产品测评

10962 点击 2026-05-03 08:49

国产大模型杀疯了！一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后，我找到了最能干活的 AI 牛马

从去年开始做这个账号以来，我其实写过不少测模型的文章。我相信也有很多朋友是因为看了我测评的文章关注我的。但从过年之后，真的就很少写模型评测的文章了。主要是我写文章的速度甚至一度跟不上模型发布的速度了。

来自主题: AI产品测评

10631 点击 2026-05-02 11:01

等 DeepSeek 回复的 30 秒，是手机最好玩的半小时

你要是问当今互联网最神秘、最玄学、连量子力学都解释不清的「时空裂缝」在哪里？它不在百慕大，也不在诺兰导演的电影里，而是在你的 DeepSeek、Claude 或者 ChatGPT 正在思考的过程里。

来自主题: AI资讯

8436 点击 2026-05-02 10:59